한글 초/중/종성 나누기: 키보드 기준

cho <- unlist(strsplit(“ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ”, “”)) jung <- unlist(strsplit(“ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ”, “”)) intToUtf8v <- Vectorize(intToUtf8) #jong2 <- c(” “, intToUtf8v(4520:(4520+26))) # 4520 = ㄱ #jong <- unlist(strsplit(” /ㄱ/ㄲ/ㄱㅅ/ㄴ/ㄴㅈ/ㄴㅎ/ㄷ/ㄹ/ㄹㄱ/ㄹㅁ/ㄹㅂ/ㄹㅅ/ㄹㅌ/ㄹㅍ/ㄹㅎ/ㅁ/ㅂ/ㅂㅅ/ㅅ/ㅆ/ㅇ/ㅈ/ㅊ/ㅋ/ㅌ/ㅍ/ㅎ”, “/”)) jong <- unlist(strsplit(“ㄱ/ㄲ/ㄱㅅ/ㄴ/ㄴㅈ/ㄴㅎ/ㄷ/ㄹ/ㄹㄱ/ㄹㅁ/ㄹㅂ/ㄹㅅ/ㄹㅌ/ㄹㅍ/ㄹㅎ/ㅁ/ㅂ/ㅂㅅ/ㅅ/ㅆ/ㅇ/ㅈ/ㅊ/ㅋ/ㅌ/ㅍ/ㅎ”, “/”)) jong2 <- intToUtf8v(4520:(4520+26)) # 4520 = ㄱ 한글의 초/중/종성을 분리하여 문장 사이 거리 구하기 (Edit-based) Approximate Matching을 위해서는 한글 초,중,종성을 분리해야 한다. 그래서 인터넷을 찾아봤는데 소득이 … 한글 초/중/종성 나누기: 키보드 기준 계속 읽기